Masterarbeit Computerlinguistik und Massenüberwachung
Bookreader Item Preview
Share or Embed This Item
- Publication date
- 2015-12-01
- Topics
- massenüberwachung, computerlinguistik, sprachtechnologie, snowden, bnd, bfv, ccc, comint, emrk, fvey, gchq, gpdel, hlt, humint, indect, lda, lsa, ndb, tfidf, nsa, nsaua, tao, sigint, stoa, ocr, osint, pnos, ukusa, vds, xks, xkeyscore, zndg
- Collection
- booksbylanguage_german; booksbylanguage
- Language
- German
- Item Size
- 413.9M
An Schweizer Stimmberechtigte: NEIN zum Geheimdienst-/Nachrichtendienstgesetz NDG stimmen!
Abstract
The master thesis gives an overview of the state-of-the-art in mass surveillance methods
and practices following the Snowden relevations and scientific papers with a focus on NLP
methods. For the practical part of this work, genesis and the nature of search terms (content
or soft selectors) used in finding text material by the needle-in-a-haystock methodology
are researched, implemented, evaluated and critically dicscussed. Quantitatively and
technically, as expected, it is found that false positive rates in general are high, eventhough
some of the surveillance methods assumed perform better considering specific cases in
comparison. Qualitatively and ethically, it is found such methods in action can never
be – socially – proportionate considering (1) their lack to take into account the semantic
complexity of natural language and (2) by the incentives they create to gather more and
more data in order to reduce possible sparse data problems or to produce true positives (at
all) – thus increasingly violating basic privacy rights.
Zusammenfassung Die Masterarbeit bietet eine Übersicht vom Stand der Technik der Massenüberwachung, gegeben die Snowden-Enthüllungen und wissenschaftliche Papers mit einem Fokus auf CL-Methoden. Im praktischen Teil der Arbeit wird die Entstehung und Natur inhaltlicher Suchbegriffe oder Selektoren, welche zur Suche von Textmaterial entsprechend der Nadel- im-Heuhaufen-Methodologie eingesetzt werden, erforscht, implementiert, evaluiert und kritisch diskutiert. Wie erwartet, wird quantitativ und technisch befunden, dass die Rate der False-Positives generell hoch ausfällt, wenn auch einige der angenommenen Überwa- chungsmethoden in spezifischen Fällen im Vergleich besser funktionieren. Qualitativ und ethisch wird befunden, dass der Einsatz solcher Methoden niemals – sozial – verhältnis- mässig sein kann, weil sie (1) der semantischen Komplexität von natürlicher Sprache nicht gerecht werden und (2) Anreize dafür geschaffen werden, immer mehr Daten zu sammeln, um mögliche Sparse-Data-Probleme zu reduzieren oder (überhaupt) True-Positives zu pro- duzieren – zum Preis grundlegende Rechte der Privatsphäre immer mehr zu untergraben. Versionen * Version 1.14: Spezielle NDG-Version (Abstimmung; einige Typos gefixt) * Version 1.13: Spezielle NDG-Version (Abstimmung) * Version 1.12: Spezielle BÜPF-Version * Version 1.11: Spezielle NDG-Version * Version 1.10: Fix Angabe Annotation S in Sachen Own-Korpus: Zwei True-Positives, statt nur ein True-Positive wurden gefunden. Die False-Positive-Rate für dieses Korpus bleibt in globo trotzdem bei praktisch 100%. * Version 1.03: Fixes Flüchtigkeitsfehler * Version 1.02: Fixes Flüchtigkeitsfehler * Version 1.01: Fixes Flüchtigkeitsfehler * Version 1.00: Originalversion gemäss Abgabe
Zusammenfassung Die Masterarbeit bietet eine Übersicht vom Stand der Technik der Massenüberwachung, gegeben die Snowden-Enthüllungen und wissenschaftliche Papers mit einem Fokus auf CL-Methoden. Im praktischen Teil der Arbeit wird die Entstehung und Natur inhaltlicher Suchbegriffe oder Selektoren, welche zur Suche von Textmaterial entsprechend der Nadel- im-Heuhaufen-Methodologie eingesetzt werden, erforscht, implementiert, evaluiert und kritisch diskutiert. Wie erwartet, wird quantitativ und technisch befunden, dass die Rate der False-Positives generell hoch ausfällt, wenn auch einige der angenommenen Überwa- chungsmethoden in spezifischen Fällen im Vergleich besser funktionieren. Qualitativ und ethisch wird befunden, dass der Einsatz solcher Methoden niemals – sozial – verhältnis- mässig sein kann, weil sie (1) der semantischen Komplexität von natürlicher Sprache nicht gerecht werden und (2) Anreize dafür geschaffen werden, immer mehr Daten zu sammeln, um mögliche Sparse-Data-Probleme zu reduzieren oder (überhaupt) True-Positives zu pro- duzieren – zum Preis grundlegende Rechte der Privatsphäre immer mehr zu untergraben. Versionen * Version 1.14: Spezielle NDG-Version (Abstimmung; einige Typos gefixt) * Version 1.13: Spezielle NDG-Version (Abstimmung) * Version 1.12: Spezielle BÜPF-Version * Version 1.11: Spezielle NDG-Version * Version 1.10: Fix Angabe Annotation S in Sachen Own-Korpus: Zwei True-Positives, statt nur ein True-Positive wurden gefunden. Die False-Positive-Rate für dieses Korpus bleibt in globo trotzdem bei praktisch 100%. * Version 1.03: Fixes Flüchtigkeitsfehler * Version 1.02: Fixes Flüchtigkeitsfehler * Version 1.01: Fixes Flüchtigkeitsfehler * Version 1.00: Originalversion gemäss Abgabe
- Addeddate
- 2015-12-01 22:16:38
- Collection_added
- booksbylanguage
- Identifier
- MA_computerlinguistikmassenueberwachung
- Identifier-ark
- ark:/13960/t2v44jj18
- Ocr
- ABBYY FineReader 11.0
- Ppi
- 300
- Scanner
- Internet Archive HTML5 Uploader 1.6.3
- Year
- 2015
comment
Reviews
3,101 Views
3 Favorites
DOWNLOAD OPTIONS
For users with print-disabilities
IN COLLECTIONS
German : Books by LanguageUploaded by vecirex on
Open Library